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zwei oder mehrere uber Disulfidbrucken verknupfte Cy- 
steine, durch a) Kultivierung prokaryontischer Zellen, 
wobei die genannten prokaryontischen Zellen einen Ex- 
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tids in das Periplasma oder das Medium, c) Abspaltung 
der Signalsequenz und Isolierung des Polypeptids aus 
dem Periplasma oder dem Medium, dadurch gekenn- 
zeichnet, daB in der genannten prokaryontischen Zelle 
zusatzlich eine fur ein molekulares Chaperon codieren- 
de Nukleinsaure exprimiert und das Chaperon ins Peri- 
plasma sekretiert wird, ist zur rekombinanten Herstel- 
lung von Polypeptiden in Prokaryonten rnit hoher Aus- 
beute geeignet. 



Verfahren zur Herstellung von naturlich gefalteten und sekretierten Proteinen durch 
Co-Sekretion von Chaperonen 



Fig. 2 
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Beschreibung 

[0001] Die Erfindung betrifft ein Verfahren zur Herstellung von wasserloslichen. naturlich gefalteten unci sekretierten 
Polypeptiden nach Expression in prokaryontischen Zellen durch Co-Sekretion von molekularen Chaperonen. 

s [0002] In prokaryontischen Organismen findet die Proteinsynthese, auch Translation genannt, an den Ribosomen 
im Cytoplasma statt. Bei einer Expression rekombinanter DNA in prokaryontischen Wirtsorganismen ist es oft wun- 
schenswert, daft das dabei erhaltene rekombinante Genprodukt bzw. Protein aus dem Cytoplasma durch die innere 
bakterielle Membran in den periplasmatischen Raum zwischen innerer und auBerer Membran sekretiert wird. Vom 
Periplasms konnen sekretierte Proteine dann z.B. durch einen osmotischen Scnock injtes Nahrmedium freigesetzt 

io werden. Ein Nachteil dieses Verfahrens ist, daB die sezernierten Polypeptide haufig nicnrdie native, biologisch aktive 
Konforrnatton ausbilden (Hockney, TIBTECH 12 (1994) 456 - 463). 

[0003] In jungster Zert wurden molekulare Chaperone und Faltungskatalysatoren, wie Peptidyl-Prolyl-cis/trans-lso- 
merasen oder Proteindisuffidisomerasen (Glockshuber et al., EP-A 0 510 658) eingesetzt, um die Ausbeute an nativem 
rekombinanten Protein bei der Faltung in vivo zu erhdhen (Thomas et al., AppL Biochem. Biotechnol. 66 (1997) 
1$ 197-238). Dies fuhrte teilweise zu erheblichen Verbesserungen bei der Expression z.B. von Ribulosebisphosphat- 
Carboxylase (RUBISCO; Goloubinoff et al., Nature 337 (1989) 44-47), humaner Procollagenase (Lee & Olins, J. BioL 
Chem. 267 (1 992) 2849-2852) oder neuronaler Stickstoffoxidsynthase aus Ratten (Roman et al., Proc. Natl. Acad. ScL 
USA 92 (1995) 8428-8432). In diesen Beispielen wurden GroEL/ES bzw. das DnaK-System aus E. coli im Cytosol co- 
uberexprimiert. 

20 [0004] Auch bei der Sekretion rekombinanter Proteine ins Periplasma von E. coli wurde die Co-Expression von 
Chaperone untersucht. Hier wurde jedoch nur eine cytosolische Oberexpression von Chaperone erprobt, um die Se- 
kretion ins Periplasma zu optimieren (Perez-Perez et al., Biochem. Biophys. Res. Commun. 210 (1995) 524-529; Sato 
et al. : Biochem. Biophys. Res. Commun. 202 (1994) 258-264; Berges et al., AppL Environ. Microbiol. 62 (1996) 55-60). 
Bisherige Versuche zur Co-Sekretion in E. coli betrafen nur Faltungshelfer-Proteine, wie z. B. Proteindisulfidisomerase 

25 (PDI; Glockshuber et al., EP-A 0 510 658) oder Peptjdyl-Prolyl-cis/trans-lsomerascn oder Dsb-Proteine (Knappik et 
al., Bio/Technology 11 (1993) 77-83; Qiu et al., Appl. Environm. Microbiol. 64 (1998) 4891-4896 und Schmidt et al., 
Prot. Engin. 11 (1998)601 -607. 

[0005] Aufgabe der Erfindung ist es, ein Verfahren zur Herstellung von wasserloslichen, naturlich gefalteten euka- 
ryontischen Polypeptiden nach Expression in Prokaryonlen zur Verfugung zu stellen, welches auf einfache Weise 
30 durchf uhrbar ist und bei dem eine aufwendige in vitro-Nachbehandlung, wie Aufldsung von inclusion bodies, Reduktion 
und Naturierung, nicht erforderlich ist. 

[0006] Die Aufgabe wird gelost durch ein Verfahren zur Herstellung eines naturlich gefalteten eukaryontischen Po- 
. lypeptids, enthaltend zwei oder mehrere uber Disulfidbrucken verknupfte Cysteine, durch 



35 a) Kultivierung prokaryontischer Zellen, wobei die genannten prokaryontischen Zellen einen Expressionsvektor 

enthalten, der fur das genannte Polypeptid, das am N-Terminus eine prokaryontische Signalsequenz enthalt, co- 
diert, 

b) Sekretion des Polypeptids in das Periplasma oder das Medium, * m 

40 

c) Abspaltung der Signalsequenz und Isolierung des Polypeptids aus dem Periplasma oder dem Medium, 

dadurch gekennzetchnet, daB in der genannten prokaryontischen Zelle zusatzlich eine fur ein molekulares Chaperon 
codierende Nukleinsaure exprimiert und das Chaperon ins Periplasma sekretiert wird. Dabei ist es bevorzugt, daB das 

45 Chaperon uberexprimiert wird. 

[0007] In einer bevorzugten Ausfuhrungsform des erfindungsgemaBen Verfahrens werden dem zur Kultivierung der 
prokaryontischen Zellen verwendeten Nahrmedium (Fermentationsmedium) zusatzlich reduzierende Thiolreagenzien, 
welche SH-Gruppen enthalten, zugesetzt, wobei die Ausbeute an rekombinant gewonnenem Protein weiter erhoht 
wird. Vorzugsweise werden 0,1-15 mmol/l Thiolreagenz zugesetzt. ErfindungsgemaB ist unter dem Begriff Thiolrea- 

so genz* entweder ein reduzierendes (reduziertes) Thiolreagenz mit SH-Gruppen oder ein Gemisch von reduzierenden 
Thiolreagenzien mit SH-Gruppen und oxidierenden Thiolreagenzien mit Disulfidgruppen zu verstehen. Bevorzugte 
Substanzen sind reduziertes Glutathion (GSH), Cystein, N-Acety Icy stein, Cysteamin, f}-Mercaptoethanol undahnliche 
Verbindungen. Die Thiolreagenzien konnen sowohl einzeln als auch in Gemischen verwendet werden. Besonders 
geeignet sind Thiolreagenzien wie beispielsweise Glutathion (GSH), die eine einzige SH-Gruppe pro Molekul aufwei- 

55 sen. Thiolreagenzien wie Glutathion, sind fur die Verbesserung der Ausbeute nativ gefalteter Proteine bei der Expres- 
sion rekombinanter DNA in prokaryontischen Zellen bekannt (Glockshuber et al., EP-A 0 510 658). 
[0008] Unter Chaperonen gemaR der Erfindung sind Proteine zu verstehen, die andere, nicht-native Proteine in vivo 
vor Aggregation schutzen und die Ausbildung ihrer nativen Konformation fordern. Molekulare Chaperone werden im 
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Stand der Technik eingesetzt. um Proteine zu stabiiisieren und damit vor Aggregation und Inaktivierung zu schutzen 
(Buchner et al., EP-A 0 556 726 A1). Vorzugsweise werden erfindungsgemaB ATP-unabhangige Chaperone des 
HSP40-Typs (Molmasse ca. 40 kDa) oder ein kleines Hrtzeschockprotein (sHSP) verwendet. DnaJ ist ein 40 kDa 
Hrtzeschockprotein, das im Cytoplasma von E. coli vorkommt und Teil des sogenannten Hsp70-Chaperonsysterns ist 
(Bukau, B. & Horwich, A., Cell 92 (1998) 351-366). Zu diesem System gehoren auBerdem DnaK (Hsp70) und GrpE. 
Bestimmte Proteine werden durch das DnaK-System in einem ATP-abhangigen ProzeB zur nativen ^Conformation ge- 
faltet (Schroder et ai., EMBO J. 12 (1993) 4137-4144; Langer et al., Nature 356 (1992) 683 - 689). Zur Ruckfaltung 
denaturierter Proteine benotigt dieses System zusatzlich ATP. DnaJ schutzt in Abwesenheit von DnaK und ATP nicht- 
native Proteine vor Aggregation und vermittelt einen Faltungs-kompetenten Zustand (Schroder et al., EMBO J. 12 
(1993) 4137-4144). Weiterhin bevorzugt ist die Co-Sekretion eines N-terminalen Fragrne^es von DnaJ, das die Ami- 
nosauren 1 -1 08 umfaBt und im Folgenden als "J-Domane" (Kelley, TIBS 23 (1 998) 222-227) bezeichnet wird. In diesem 
Bereich betinden sich die J-Domane und eine G/F-reiche Domane, die Wechselwirkungen mit DnaK ausuben (Wall et 
al., J. Biol. Chem. 270(1995)2139-2144). Es wurdegezeigt, daft die Co-Expression von DnaJ im Cytosolzur Erhohung 
der Ausbeute an loslichem Protein fuhren kann (Yokoyama et al., Microbiol. Ferment. Technol. 62 (1998) 1205-1210). 
[0009] Hsp25 (z.B. aus der Maus) ist ein Vertreter der kleinen Hitzeschockproteine (Gaestel et al., Eur. J. Biochem. 
179 (1989) 209-213), einer Klasse von Chaperonen, die ubiquitar verbreitet ist. Die Molmasse dieser Proteine liegt 
zwischen 15 und 30 kDa. Bei Hitzeschock werden die sHsps in der Zelle stark angereichert (bis zu 1% des Gesamt- 
zellproteins - Arrigo & Landry (1994), In Morimoto (Hrsg.): The Biology of Heat Shock Proteins and Molecular Chape- 
rones, Cold Spring Harbour Press, 335-373). Wie DnaJ-Proteine besitzen sHsps die Eigenschaft, die Aggregation von 
nichtnativen Proteinen zu verhindern und diese in einem faltungskompelenten Zustand zu hallen (Jakob et al., J. Biol. 
Chem. 268(1993) 1517-1520; Ehrsperger et al., EMBO J. 16(1997)221-229). 

[0010] Der Begriff "Uberexpression" gemaB vorliegender Erfindung bedeutet eine Steigerung der Expression der 
sekretierten Chaperone wie z.B. DnaJ- und Hsp25 (vorzugsweise um mindestens 100%) im Vergleich zur Expression 
im Wildtyp des jeweils verwendeten prokaryontischen Wirtsorganismus. Eine solche Uberexpression laGt sich z.B. 
dadurch erreichen, daB sich die Gene (fur das Protein, Chaperon und/oder Signalpeptid) unter Kontrolle eines starken 
prokaryontischen, vorzugsweise induzierbaren Expressionssignals (z.B. eines lac- oder T7-Promotors oder eines De- 
rivates davon) befinden. 

[0011] Das Sekretionskonstrukt fur die Uberexpression der Polypeptide (Proteine) samt regulatorischer Regionen 
(Promotor und Terminator) auf der rekombinanten DNA ist vorzugsweise in einen vektor, welcher zusatzlich die in 
Prokaryonten seltene Arginin-tRWA AGA/AGG codiert integriert oder wird mit einem Vektor, welcher diese tRNA codiert, 
co-exprimiert (Brinkmann et aL. Gene 85 (1989) 109-114). Dies ermoglicht sowohl die Co-Uberexpression der jewei- 
ligen Proteine ins bakterielle Periplasma als auch die Transkription der seltenen tRNA Ar 9 AGA/AGG , was eine erhohte 
Synthese des gewunschten Proteins im bakteriellen Wirtsorganismus zur Folge hat. Die fur das Polypeptide und das 
Chaperon codierenden Nukleinsauren konnen auf einem Vektor oder auf zwei getrennten Vektoren lokalisiert sein. 
[0012] Unter einer prokaryontischen Signalsequenz im Sinne der Erfindung ist ein Nukleinsaurefragment zu verste- 
hen, welches aus Prokaryonten, vorzugsweise aus gramnegativen Bakterien, abgeleitet ist und das Durchdringen von 
an das Signalpeptid gebundenen Proteinen durch die inneren bakteriellen Membranen gewahrleistet. Dadurch werden 
die Proteine im Periplasma bzw. im Zelluberstand lokalisiert. Solche Signalsequenzen haben ublicherweise eine Lange 
von 18-30 Aminosauren und sind beispielsweise beschrieben in Murphy & Beckwith: Export of Proteins to the Cell 
Envelope in Escherichia coli und in Neidhardt et al. (Hrsg.): Escherichia coli and Salmonella, Second Edition, Vol. 1, 
ASM Press, Washington, 1996, S. 967-978. Die Abspaltung von bakteriellen Signalsequenzen kann z.B. nach einer 
Sequenz Ala-X-Ala stattfinden (von Heijne et al., J. Mol. Biol. 184 (1985) 99-105). Die Strukturder bakteriellen Signal- 
peptidase ist beschrieben in Paetzel et al., Nature 396 (1998) 186-190. Vorzugweise werden Signalsequenzen ver- 
wendet, welche durch im Periplasma von prokaryontischen Zellen lokalisierten Proteasen vom gewunschten Protein 
wieder abgespalten werden. Afternativ kann durch Zugabe solcher Proteasen zum Zelluberstand oder zum isolierten 
Protein die Abspaltung der Signalsequenz erfolgen. 

[0013] Mit dem erfindungsgemaBen Verfahren kann die heterologe Expression einer Vielzahl von eukaryontischen 
Proteinen wie z.B. Proteasen, Interferone, Proteinhormone, Antikdrper oder Fragmenten davon verbessert werden. 
Besonders geeignet ist das Verfahren fur die heterologe Herstellung von Proteinen, die im nativen Zustand mindestens 
zwei uber eine Disulfidbrucke verknuptte Cysteine enthalten und dann, wenn sie N-terminal keine fusionierte proka- 
ryontische Signalsequenz besitzen, bei der prokaryontischen Expression als unlosliche inclusion bodies entstehen. 
Besonders geeignet ist das Verfahren fur Proteine, die mehr als 5 Disulfidbrucken in nativem Zustand enthalten. Ein 
solches Protein ist beispielsweise ein rekombinanter Plasminogenaktivator (im folgenden rPA genannt, Martin et al., 
Cardiovasc. Drug Rev. 11 (1993) 299-311, US-Patent Nr. 5,223,256). rPA besitzt 9 Disulfidbrucken, die im reduzieren- 
den Cytosol von E. coli nicht ausgebildet werden. 

[001 4] Dabei wird die periplasmatische Lokalisation des Proteins und des Chaperons durch "operative Verknupf ung" 
mit einem Signalpeptid zum Durchdringen innerer bakterieller Membranen gewahrleistet. 

[0015] Zur Gewinnung des sekretorischen rPA-Proleins in funktionaler Form in E. coli wurde das Gen fur dieses 
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Protein aus dem Plasmid pA27fd7 (Kohnert et aL, Protein Engineering 5 (1 992) 93-1 00) mit gentechnologischen Mitteln - 
an eine prokaryontische Signalsequenz gramnegativer Bakterien, beispielsweise an die Signalsequenz von Pectat- 
lyase B (PelB) von Erwinia amylovora, fusioniert Die Genlusion wurde durch Klonierung in den Vektor pET20b(+) 
(Novagen Inc., Madison, USA) hergestellt Damit unterliegt die Genexpression der Kontrolle des T7-Promotors. Die 
im Fusionsprotein vorhandene Signalsequenz bewirkt die Sekretion ins Periplasma. Wahrend Oder nach der Sekretion 
wird die Signalsequenz durch eine in der inneren Membran lokalisierte Peptidase abgespalten. Sezerniertes Protein 
kann dann im Periplasma fallen. Die oxidierenden Bedingungen dieses Kompartiments ermoglichen die Ausbildung 
von Disulfidbrucken. Durch gleichzeitige Co-Uberexpression von Chaperonen wie DnaJ, J-Domane Oder Hsp25 im 
Periplasma gelingt es, die Ausbeute an funktionalen Protein urn mehr als das 100-fachadtu steigem. 
[0016] Weitere Beispiele von erfindungsgemaB herstellbaren Polypeptiden sind Antikorper oder Antikorperfragmen- 
te, beispielsweise ein Single-Chain Fv-Fragment (ScF v , z.B. gegen das Schilddrusen-stimulierende Hormon (thyroide 
stimulating hormone, TSH). ScF v s sind verkurzte Antikorper, die nur aus den variablen Abschnitten (F v ) der schweren 
und leichten Kette eines Antikorpers bestehen, die uber einen kurzen (meist Gly 4 Ser 3 ) Linker kunstlich fusioniert sind 
(Hudson, Curr. Opin Biotechnol. 9 (1998) 395-402). ScF v s haben normalerweise die gleiche Affinitat zum Antigen wie 
die paternalen F v -Strange, konnen jedoch in E. coli Qberexprimiert werden. Da sie stabilisierende I ntradoman en -Di- 
sulfidbrucken besitzen, die essentiell fur die Stabilitat sind, fuhrt eine Expression im Cytosol meist zur Bildung von 
Inclusion Bodies (Ubersichtsartikel: Shibui et aL, AppL Microbiol. Biotechnol. 37 (1 992) 352-357). ScF v s konnen durch 
Zufallsmutationen und anschlieBende Phage-Display-Selektion auf Bindung gewunschter Antigene gezielt optimiert 
werden (Ubersichtsartikel: Allen et al., TIBS 20 (1995) 511-516). 

[0017] Die (oigenden Beispiele, Publikationen, das Sequenzprotokoll und die Abbildungen erlautern die Erfindung, 
deren Schutzumtang sich aus den Patentanspruchen ergibt, weiter Die beschriebenen Verfahren sind als Beispiele 
zu verstehen die auch noch nach Modrfikationen den Gegenstand der Erfindung beschreibea 



Beschreibung des Sequenzprotokolls 

25 

[0018] SEQ ID NO: 1 und 2 zeigen die Sequenz des Teils des Expressionsplasmides pUBS520-plN-dnaJ, der fur 
das Fusionsprotein aus OmpA-Signalsequenz und DnaJ codiert, zusammen mit den regulatorischen Sequenzen (Pro- 
motor, Terminator), die aus pIN III ompA3-dnaJ amplifiziert wurden. 

[0019] SEQ ID NO: 3 und 4 zeigen die Sequenz des Teils des Expressionsplasmides pUBS520-plN-J-Domain, der 
30 fur das Fusionsprotein aus OmpA-Signalsequenz und J-Domane codiert, zusammen mit den regulatorischen Sequen- 
zen (Promotor Terminator), die aus pIN III ompA3-dnaJ amplifiziert wurden. 

[0020] SEQ ID NO: 5 und 6 zeigen die Sequenz des Teils des Expressionsplasmides pUBS520-plN-hsp25, der fur 
das Fusionsprotein aus OmpA-Signalsequenz und Hsp25 codiert, zusammen mit den regulatorischen Sequenzen (Pro- 
motor, Terminator), die aus pIN III ompA3-hsp25 amplifiziert wurden. 
35 [0021] SEQ ID NO: 7 und 8 zeigen die Sequenz des Teils des Expressionsplasmides pUBS520-ScFvOx, der fur 
das Fusionsprotein aus PelB-Signalsequenz und ScFvOxazolon codiert, zusammen mit den regulatorischen Sequen- 
zen (Promotor, Terminator), die aus pHEN-ScFv bzw. pIN III ompA3 amplifiziert wurden. 

[0022] SEQ ID NO: 9 und 10 zeigen die Sequenz des Teils des Expressionsplasmides pET20b(+)-rPA, der fur das 
Fusionsprotein aus PelB-Signalsequenz und rPA codiert. ** 

40 

Beschreibunq der Fiquren 



[0023] Fig. 1 zeigt einen Western Blot der limitierten Proteolyse von periplasmatisch und cytosolisch exprimiertem 
DnaJ mit 50 ug/ml Trypsin zum Nachweis der zellularen Lokalisation und der nativen Faltung. Die Molgewichtsstan- 
dards wurden links und rechts aufgetragen. Zur Kontrolle wurde gereinigtes DnaJ (links) derselben Prozedur unterzo- 
gen, jedoch mrt 6,25 jig/ml Trypsin. 

[0024] Fig. 2 zeigt einen Vergleich der Expression von rPA im Periplasma von E. coli BL21 (DE3) bei Co-Sekretion 

von DnaJ und bei Zusatz von GSH und verschiedenen niedermolekularenfallungsverbessernden Sloffen zum Medium. 

[0025] Fig. 3 zeigt eine schematische Darstellung des Expressionsplasmides pUBS520-plN-dnaJ. 

[0026] Fig. 4 zeigt eine schematische Darstellung des Expressionsplasmides pUBS520-plN-J-Domain. 

[0027] Fig. 5 zeigt eine schematische Darstellung des Expressionsplasmides pUBS520-plN-hsp25. 

[0028] Fig. 6 zeigt eine schematische Darstellung des Expressionsplasmides pUBS520-ScFvOx. 

[0029] Fig. 7 zeigt eine schematische Darstellung des Expressionsplasmides pET20b(+)-rPA. 

AHgemeines: 

[0030] Zur periplasmatischen Uberexpression von DnaJ, der J-Domane sowie Hsp25 in E. coli wurde die DNA, die 
fur diese Proteine codiert, mit gentechnologischen Mitteln an die Signalsequenz des Outer Membrane Proteins A 
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(OmpA) von E. coli fusionieri und die Fusion auf einem rekombinanten Plasmid unter Kontrolle des lac-lpp-Promotors 
in E. coli exprimiert. Somit werden die Polypeptidkette von DnaJ und Hsp25 ins Periplasma des prokaryontischen 
Wirtsorganismus transporttert und dort nativ gefaltet. Die Lokalisation und native Faltung konnte dabei durch limitierte 
Proteolyse mil Trypsin und Western Blot nachgewiesen werden. 

5 

Beispiel 1: 

Konstruktion des Expressionsplasmides pIN III omp A3-dnaJ 

10 [0031] Molekuiargenetische Techniken beruhten auf Ausubel et al. (Hrsg.), J. Wiley &^ons, 1997, Curr. Protocols 
of Molecular Biology. Oligonucleotide wurden von den Firmen MWG Biotech, Ebersberg oder GIBCO Life Sciences, 
Eggenstein, DE bezogen. 

[0032] Das Gen, das fur DnaJ codiert, Gene Bank Accession No. M 12565, wurde uber die Restriktionsschnittstellen 
EcoRI und BamHI in das Expressionsplasmid pIN III ompA3 (Ghayreb et al., EMBO J. 3 (1984) 2437-2442) kloniert. 

75 Die Sequenz des klonierten PCR-Fragments wurde durch Didesoxy-Sequenzierung (LiCor DNA-Sequencer 4000, 
MWG Biotech, Ebersberg) uberpruft. Das resultierende Plasmid wurde pIN III ompA3-dnaJ bezeichnet. Die Sequenz 
des periplasmatisch exprimierten DnaJ unterscheidet sich von dem Wildtyp-Protein dahingehend, daB die Potypep- 
tidsequenz mit Gly-lle-Pro beginnt statt mit Met, es fand somit eine Verlangerung des N-Terminus um 2 Aminosauren 
statt. DnaJ befindet sich damit unter Kontrolle des lac-lpp-Promotors, der mit IPTG (Isopropyl-p-D-Thiogalactosid) 

20 induziert wird. 

Beispiel 2: 

Konstruktion des Expressionsplasmides pUBS520-plN-dnaJ 

25 

[0033] Mittels PCR wurde der Bereich aus dem Plasmid pIN III ompA3-dnaJ amplifiziert, der fur das lac-lpp Operon, 
die Signalsequenz, das dnaJ-Gen und die Terminator-Region des Operons codiert (SEQ ID NO: 1), Das PCR-Produkt 
wurde mit der Restriktionsendonuclease Bglll geschnitten und in den mit der Restriktionsendonuclease BamHI linea- 
risierten Vektor pUBS520 kloniert. Das resultierende Plasmid wurde pUBS520-plN-dnaJ bezeichnet (Fig. 3). 

30 

Beispiel 3: 

Konstruktion des Expressionsplasmides pUBS 520-plN-J- Domain 

35 [0034] Mittels des QuikChange-Mutagenese-Systems (Promega, Mannheim, DE) wurden im Plasmid pUBS 
520-plN-dnaJ nach dem Nucleotid 324 zwei Stop-Codone eingefugt, so da3 nur noch die ersten 108 Aminosauren 
exprimiert werden. Die Sequenz des mutagenisierten Bereiches wurde durch Didesoxy-Sequenzierung (LiCor DNA- 
Sequencer 4000, MWG Biotech, Ebersberg) und die Expression des verkurzten Proteinfragments durch Western Blot- 
ting und Detektion mit einem Anti-DnaJ-Antikdrper nachgewiesen. Das entstanden&Plasmid wurde mit pUBS 520-plN- 

^0 J-Domain (Fig. 4) bezeichnet. 

Beispiel 4: 

Konstruktion des Expressionsplasmides pIN III ompA3-hsp25 

45 

[0035] Das Gen, das 1urHsp25 codiert, Gene Bank Accession No.: L 07577, wurde uber die Restriktionsschnittstellen 
EcoRI und BamHl in das Expressionsplasmid pIN III ompA3 (Ghayreb et aL, EMBO J. 3 (1 984) 2437-2442) kloniert. 
Die Sequenz des klonierten PCR-Fragments wurde durch Didesoxy-Sequenzierung (LiCor DNA-Sequencer 4000, 
MWG Biotech, Ebersberg) uberpruft. Das resultierende Plasmid wurde pIN III ompA3-hsp25 bezeichnet. Die Sequenz 
50 des periplasmatisch exprimierten Hsp25 unterscheidet sich von dem Wildtyp-Protein dahingehend, daB die Polypep- 
tidsequenz mit Gly-lle-Leu beginnt statt mit Met, es fand somit eine Verlangerung des N-Terminus um 2 Aminosauren 
statt. Hsp25 befindet sichdamrt unter Kontrolle des lac-lpp-Promotors, der mit IPTG (Isopropyl-p-D-Thiogalactosid) 
induziert wird. 

55 
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Beispiel 5: 

Konstruktion des Expressionsplasmides pUBS520-plN-hsp25 

5 [0036] Mittels PCR wurde der Bereich aus dem Plasmid pIN III ompA3-hsp25 amplifiziert, der fur das lac-!pp Operon, 
die Signaisequenz, das hsp25-Gen und die Terminator- Region des Operons codiert (SEQ ID NO: 5). Das PCR-Produkt 
wurde mit der Restriktionsendonuclease Bglll geschnitten und in den mit der Restriktionsendonuclease BamHI linea- 
risierten Vektor pUBS520 kloniert. Das resultierende Plasmid wurde pUBS520-plN-hsp25 bezeichnet (Fig. 5). 

io Beispiel 6: ^ 



Konstruktion des Expressionsplasmides pUBS520-ScFvOx 

[0037] Als negativ-Kontrolle wurde die Co-Expression eines Single-Chain-Fv-Fragmentes, das gegen das Hapten 
Oxazolon gerichtet ist (ScFvOxazolon; Fiedler und Conrad, Bio/Technology 13 (1995) 1090-1093 untersucht, das keine 
Chaperon-Eigenschaften besitzt 

[0038] Mittels PCR wurde der Bereich aus dem Plasmid pHEN-ScFvOx amplifiziert, der fur den lac-Promotor, die 
Signaisequenz pelB und das sctvox-Gen codiert. In einer zweiten PCR wurde der Bereich aus dem Plasmid pIN III 
ompA3 amplifiziert, der fur den Ipp-Terminator codiert. in einer anschlieBenden PCR wurden die beiden Fragmente 
fusioniert. Das so entstandene PCR-Produkt (SEQ ID NO: 7) wurde mil der Restriktionsendonuclease Bgll I geschnitten 
und in den mit der Restriktionsendonuclease BamHI lineartsierten Vektor pUBS520 kloniert. Das resultierende Plasmid 
wurde pUBS520-ScFvOx bezeichnet (Fig. 6). 



Beispiel 7: 

2S 

Konstruktion des Expressionsplasmides pET20b(+)-rPA 

[0039] Mit Hilfe der PCR-Methode wurde das Gen eines Plasminogenaktivators (rPA) aus dem Plasmidvektor 
pA27fd7 (Kohnert et a!., Protein Engineering 5 (1992) 93-100) amplifiziert. Das PCR-Produkt wurde mit den Restrik- 

30 tionsendonucleasen Ncol und BamHI gespalten und in den Plasmidvektor pET20b(+) (Novagen Inc., Madison, USA) 
kloniert. Das Piasmid codiert fur ein Fusionsprotein, welches aus der Signaisequenz von PelB (Pectatlyase aus Erwiriia 
amylovora) und rPA besteht und die Sekretion von rPA ins Periplasma Didesoxy-Sequenzierung (LiCor DNA-Se- 
quencer4000, MWG Biotech, Ebersberg, DE) uberpruft. Das Konstrukt wurde als pET20b(+)-rPA bezeichnet (Fig. 7). 
In dem Plasmid wird rPA unter Kontrolle des T7-Promotors exprimiert, wobei die T7-RNA-Polymerase im Stamm E. 

35 coli BL21 (DE3) der Kontrolle des lacU V5-Promotors unterliegt. Die Induktion erfolgt durch Zugabe von IPTG. Das 
periplasmatisch exprimierte rPA unterscheidet sich von dem bei Kohnert et al beschriebenen Plasm inogenaktivator 
durch Austausch der zweiten Aminosaure (Ser) gegen Ala. 

Beispiel 8: 

40 

Funktionale Expression von rPA im Periplasma von E. coli 

[0040] Eine stationare Ubernachtkultur von E. coli BL21 (DE3) (Studier & Moffat, J. MoL Biol. 189 (1 986) 113-130), 
die mtt pET20b(+)-rPA und pUBS520-plN-dnaJ transformiert wurde (Co-Expression von DnaJ), eine Ubernachtkultur 

45 von E. coli BL21(DE3), die mit pET20b(+)-rPA und pUBS520-plN-J-Domain transformiert wurde (Co-Expression der 
J-Domane), eine Ubernachtkultur von E. coli BL21(DE3), die mit pET20b(+)-rPA und pUBS520-plN-hsp25 transformiert 
wurde (Co-Expression von Hsp25), eine Ubernachtkultur von E. coli BL21(DE3) ( die mit pET20b(+)-rPA und 
pUBS520-ScFvOx transformiert wurde (Co-Expression von ScFvOx), eine Obernachtkullur von E. coli BL21 (DE3), die 
mit pET20b(+)-rPA und pUBS520 transformiert wurde bzw. eine Ubernachtkultur von E. coli BL21 (DE3), die mit pET20b 

so (+) und pUBS520 transformiert wurde (Kontrollkultur), wurde im Verhaltnis 1:50 in 100 ml LB-Medium mit Ampicillin 
(100 |ig/ml) und Kanamycin (50 u.g/ml, Fluka Chemica, Neu-Ulm, DE) verdunnt und bei 24°C und 170 rpm geschuttelt. 
Nach 3 h Wachstum wurden je 5ml der Kultur zu je 10 ml LB-Medium mit o.g. Mengen an Ampicillin und Kanamycin 
und verschiedenen Konzentrationen von GSH (0-10 mM, Fluka, DE) gegeben und mit jeweils 1mM IPTG (Isopropyl- 
P-D-Thiogalactosid, AppliChem, Darmstadt, DE) induziert. Die Zellen wurden weitere 21 h bei 24 °C und 170 rpm 

5S geschuttelt und nach Bestimmung derOD 600 eine 1 mi-Probe genommen. Diese 1 ml-Zellproben wurden nach einer 
modifizierten Vorschrift nach Jacobi et al. (J. Biol. Chem. 272 (1997) 21692-21699) in 2 ml-Eppendorf-Reaktionsge- 
fa&en fraktioniert. Im Detail wurde das Zellpellet mit 500 pi Fraktionierungspuffer (150 mM NaCI (Roth GmbH), 50 mM 
Tris/HCI (Roth GmbH, 5mM EDTA (Biomol) und 1 mg/ml Polymyxin-B-Sulfat (Sigma), pH 7,5) versetzt, 1 h bei 10 °C 
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auf einem Eppendorf-Thermoschuttler bei 1400 rpm geschuttelt und dann 15 min bei 14 000 rpm in einer auf 10°C 
gekuhften Eppendorf-Mikrozentrifuge zentrifugiert, sodaG eine Fraktion mit den loslichen periplasmatischen Proteinen 
(Uberstand) und eine Restfraktion (Pellet) entstand. 

[0041] Die Bestimmung von der Aktivitat von rPA erfolgte im wesentlichen nach der Methode von Verheijen et al. 
s Thromb. Haemostasis 48 (1 982) 266-269). 

[0042] Alle ermittetten rPA-Konzentrationen in den Zellextrakten wurden auf Zellsuspensionen von 00^=1 nor- 
miert, um den Fehler, der bei der Messung in verschiedenen Puffern auftritt, zu korrigieren. Die Ergebnisse zeigt Tabelle 
1. 





Tabelle 1 : 




Effekt von L-Arginin im Fermentationsmedium auf die Ausbildung von nativem rPA im Periplasma 


Co-sekretiertes Protein 


rPA in ng/ml*OD 600 


St im u lationsf a ktor 




0,030 ± 0,001 


29 


DnaJ 


0,1 97 ±0,01 9 


29 


J-Domane 


0,339 ±0,007 


16 


Hsp25 


0,053 ± 0,002 


27 


ScFvOxazolon (Kontrolle) 


0,041 ± 0,003 


13 



[0043] Die Kultivierung erfolgte in Gegenwart von 5 mM GSH. 



Beispiel 9: 

2S 

Nachweis der periplasmatischen Lokalisation von DnaJ, das mittels pIN III ompA3 exprimiert wurde 

[0044] Um die periplasmatische Lokalisierung und korrekte Faltung von DnaJ, das mittels pIN III ornpA3-dnaJ ins 
Periplasma sekretiert wurde, zu uberprufen, wurden Spharoplasten prapariert. Dazu wurden E. coli XLI-Blue-Zellen, 

30 die mit pIN tli ompA3-dnaJ transformiert waren, 1:50 aus einer stationaren Vorkultur in LB-Medium (11 LB-Medium 
enthalt 10 g Bacto-Trypton (Difco Factories, Detroit, Michigan, USA), 5 g Yeast-Extract (Difco Factories) und 5 g NaCI 
(Roth GmbH, Karlsruhe) mit 100 u.g/ml Ampicilin (Sigma, Deisenhofen) verdunnt, bei 37°C und 200 rpm angezogen 
und nach 2,75 h (OD 600 ca.0,5) mit 1 mM IPTG induziert Nach 3 h Wachstum in Anwesenheit des Induktors wurden 
die Zellen mittels Zentrifugatbn (Eppendorf-Mikrozentrifuge. 5000 rpm, 5 min) geerntet. Als Kontrolle wurde ein E. 

35 coli-Stamm, der ein Plasmid zur intrazellularen Oberexpression von DnaJ enthalt, kultiviert und 3 h induziert. Aus den 
nach Zentrifugation erhaltenen Zellpellets wurden Spharoplasten folgendermaBen prapariert: 

[0045] Das Aquivalent von 2 ml Bakterien, die einer OD^o von 1 entsprachen, wurde in einer 0,5 M Sucrose (ICN, 
Bbmedicals, Eschwege)/0,2 M Tris/HCl/0,5 mM EDTA-(Biomol Feinchemikalien, Hamburg) Losung (pH &), mit 2|ig/ 
ml Lysozym (Sigma, Deisenhofen) resuspendiert und 30 min auf Eis inkubiert. Danach wurden die Proben 5 min bei 

4° 15000 rpm in einer Eppendorf-Mikrozentrifuge pelletiert und mit 100 uJ TE-Puffer (10 mM Tris/HCI (Ftoth GmbH), 1 
mM EDTA, pH 8) gewaschen. Die als Pellet anfallenden Spharoplasten wurden in 30 \x\ 50 mM Tris/HCI, pH 8,0 mit 
100 mM NaCI aufgenommen. Als Kontrolle wurden Spharoplasten in demselben Puffer, jedoch mit zusatzlich 0,1 % 
Triton<E>-X-100 (Amresco, Solon, Ohio, USA), aufgenommen. Fur eine anschlieBende limitierte Proteolyse mit Trypsin 
wurden 15 uJ der jeweiligen Spharoplastenpraparation (mit bzw. ohne Triton®-X-100) mit 2 uJ 1mg/ml Trypsin (Roche 

45 Diagnostics GmbH, DE) und 23 uJ 50 mM Tris/HCI, pH 8,0 mit 100 mM NaCI gemischt und bei 20°C inkubiert. Nach 
0, 5 und 30 Minuten wurden je 8 uJ Proben genommen, mit 2 uJ 4 mg/mi Soybean-Trypsin-lnhibitor und 3 uJ SDS-PAGE 
-Aurtragspuffer (4% Glycerin (Sigma, Deisenhofen), 0,5 % SDS (ICN), 2% Mercaptoethanol (Sigma), 0,0625 M Tris/ 
HCI, pH 6,8 und Bromphenolblau (Sigma)) versetzt und 5 min gekocht. In einem Kontrollversuch wurden 2 jig gerei- 
nigtes DnaJ (2 MQ/uJ) mit 1 uJ 100u,g/ml Trypsin und 14 uJ 50 mM Tris/HCI, pH 8,0 mit 100 mM NaCI gemischt, bei 20°C 

50 inkubiert und die Proteolyse zu den angegebenen Zeitpunkten beendet. Die Proteolyseprodukte wurden durch SDS- 
PAGE nach Lammli et aL, Nature 227 (1970) 680-685) aufgetrennt. Die aufgetrennten Proteine wurden auf Nrtrocel- 
lulosemembranen (BioRad Laboratories, Munchen) ubertragen (Khyse-Anderson, J. Biochem. Biophys. Methods 10 
(1984) 203-207; Towbin et al., Proc. Natl. Acad. Sci. USA 79 (1979) 267-271). Die Membranen wurden mit TBS-5% 
Milchpulver (Glucksklee, Nestle Frankfurt) uber Nacht geblockt und im Folgenden 2h mit Anti-DnaJ-Antikorper in TBS- 

55 5% Milchpulver fur 2 h dekorrert Nach 3 Waschschritten fur jeweils 5 min in TBS wurde mit einem werteren Antikorper 
(Anti-Rabbit-lgG-Peroxidase, Amersham Life Sciences, Braunschweig) in TBS-5% Milchpulver fur 1 : 5 h inkubiert und 
wiederum 5x mit TBS-Puffer gewaschen. Zur Detektion wurde das ECL-Western-Blotting-Detection-Kit der Firma 
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Amersham verwendet. Das Ergebnis ist in Fig. 1 gezeigt. Da das sekretierte Chaperon nach Spharoplastenpraparation - 
Protease-sensitiv ist, wurde nachgewiesen, daft es auf der periplasmatischen Serle der inneren Membran lokalisiert 
ist. Im Gegensatz dazu ist intrazeliulares Dna J auch nach der Spharoplastierung proteasegeschutzt. Wurden die Spha- 
roplasten durch Triton-X-100 permeabilisiert, wird intrazeliulares DnaJ durch Trypsin verdaut. Das Spaltmuster des 
5 periplasmatisch exprimierten DnaJ ist identisch zu dem von gereinigtem, nativem DnaJ. Damit war nachgewiesen, 
daB das periplasmatische Expressionsprodukt in diesem Kompartiment nativ vorliegt. 
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SEQUENZPROT0KOLL 
<110> F. Hoffmann -La Roche AG 

<12 0> Verfahren zur Herstellung von natuerlich 

gefalteten und sekretierten Proteinen durch Co-Sekretion von 
molekularen Chaperonen 

<130> Case 20381 

<160> 10 

<210> 1 

<211> 1881 

<212> DNA 

<213> E. coli 

<220> 

<221> CDS 

<222> (392) . . . (1591) 

<400> 1 

TAGGCGTATC ACGAGGCCCT TTGGATAACC AGAAGCAATA AAAAATCAAA TCGGATTTCA 60 

CTATATAATC TCACTTTATC TAAGATGAAT CCGATGGAAG CATCCTGTTT TCTCTCAATT 120 

TTTTTATCTA AAACCCAGCG TTCGATGCTT CTTTGAGCGA ACGATCAAAA ATAAGTGCCT 180 

TCCCATCAAA AAAATATTCT CAACATAAAA AACTTTGTGT AATACTTGTA ACGCTACATG 240 

GAGATTAACT CAATCTAGCT AGAGAGGCTT TACACTTTAT GCTTCCGGCT CGTATAATGT 3 00 

GTGGAATTGT GAGCGGATAA CAATTTCACA CAGGAAACAG CTATGACCAT GATTACGGAT 360 

TCACTGGAAC TCTAGATAAC GAGGG CAAAA A ATG AAA AAG ACA GCT ATC GCG 412 

Met Lys Lys Thr Ala lie Ala 
1 5 * 

ATT GCA GTG GCA CTG GCT GGT TTC GCT ACC GTA GCG CAG GCC GGA ATT 460 
He Ala Val Ala Leu Ala Gly Phe Ala Thr Val Ala Gin Ala Gly He 
10 15 20 

CCA GCT AAG CAA GAT TAT TAC GAG ATT TTA GGC GTT TCC AAA ACA GCG 508 
Pro Ala Lys Gin Asp Tyr Tyr Glu He Leu Gly Val Ser Lys Thr Ala 
25 30 35 

GAA GAG CGT GAA ATC AGA AAG GCC TAC AAA CGC CTG GCC ATG AAA TAC 556 
Glu Glu Arg Glu He Arg Lys Ala Tyr Lys Arg Leu Ala Met Lys Tyr 
40 45 50 55 

CAC CCG GAC CGT AAC CAG GGT GAC AAA GAG GCC GAG GCG AAA TTT AAA 604 
His Pro Asp Arg Asn Gin Gly Asp Lys Glu Ala Glu Ala Lys Phe Lys 
60 65 70 
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GAG ATC AAG GAA GCT TAT GAA GTT CTG ACC GAC TCG CAA AAA CGT GCG 652 
Glu lie Lys Glu Ala Tyr Glu Val Leu Thr Asp Ser Gin Lys Arg Ala 
75 80 85 

GCA TAC GAT CAG TAT GGT CAT GCT GCG TTT GAG CAA GGT GGC ATG GGC 700 
Ala Tyr Asp Gin Tyr Gly His Ala Ala Phe Glu Gin Gly Gly Met Gly 
90 95 100 

GGC GGC GGT TTT GGC GGC GGC GCA GAC TTC AGC GAT ATT TTT GGT^tpJCZ 74 8 

Gly Gly Gly Phe Gly Gly Gly Ala Asp Phe Ser Asp lie Phe Gly Asp 
105 110 115 

GTT TTC GGC GAT ATT TTT GGC GGC GGA CGT GGT CGT CAA CGT GCG GCG 796 
Val Phe Gly Asp He Phe Gly Gly Gly Arg Gly Arg Gin Arg Ala Ala 
120 125 130 135 

CGC GGT GCT GAT TTA CGC TAT AAC ATG GAG CTC ACC CTC GAA GAA GCT 844 
Arg Gly Ala Asp Leu Arg Tyr Asn Met Glu Leu Thr Leu Glu Glu Ala 
140 145 150 

GTA CGT GGC GTG ACC AAA GAG ATC CGC ATT CCG ACT CTG GAA GAG TGT 892 
Val Arg Gly Val Thr Lys Glu lie Arg He Pro Thr Leu Glu Glu Cys 
155 160 165 

GAC GTT TGC CAC GGT AGC GGT GCA AAA CCA GGT ACA CAG CCG CAG ACT 94 0 

Asp Val Cys His Gly Ser Gly Ala Lys Pro Gly Thr Gin Pro Gin Thr 
170 175 180 

TGT CCG ACC TGT CAT GGT TCT GGT CAG GTG CAG ATG CGC CAG GGA TTC 988 
Cys Pro Thr Cys His Gly Ser Gly Gin Val Gin Met Arg Gin Gly Phe 
185 190 195 

TTC GCT GTA CAG CAG ACC TGT CCA CAC TGT CAG GGC CGC GGT ACG CTG 1036 
Phe Ala Val Gin Gin Thr Cys Pro His Cys Gin Gly Arg Gly Thr Leu 
2.00 205 210 215 

ATC AAA GAT CCG TGC AAC AAA TGT CAT GGT CAT GGT CGT GTT GAG CGC 1084 
He Lys Asp Pro Cys Asn Lys Cys His Gly His Gly Arg Val, Glu Arg 
220 225 230 

AGC AAA ACG CTG TCC GTT AAA ATC CCG GCA GGG GTG GAC ACT GGA GAC 1132 
Ser Lys Thr Leu Ser Val Lys lie Pro Ala Gly val Asp Thr Gly Asp 
235 240 245 

CGC ATC CGT CTT GCG GGC GAA GGT GAA GCG GGC GAG CAT GGC GCA CCG 1180 
Arg He Arg Leu Ala Gly Glu Gly Glu Ala Gly Glu His Gly Ala Pro 
250 255 260 

GCA GGC GAT CTG TAC GTT CAG GTT CAG GTT AAA CAG CAC CCG ATT TTC 1228 
Ala Gly Asp Leu Tyr Val Gin Val Gin Val Lys Gin His Pro He Phe 
265 270 275 



GAG CGT GAA GGC AAC AAC CTG TAT TGC GAA GTC CCG ATC AAC TTC GCT 1276 
Glu Arg Glu Gly Asn Asn Leu Tyr Cys Glu Val Pro He Asn Phe Ala 
55 2 8 0 2 8 5 2 9 0 2 95 
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ATG GCG GCG CTG GGT GGC GAA ATC GAA GTA CCG ACC CTT GAT GGT CGC 1324 
Met Ala Ala Leu Gly Gly Glu lie Glu Val Pro Thr Leu Asp Gly Arg 
300 305 310 

GTC AAA CTG AAA GTG CCT GGC GAA ACC CAG ACC GGT AAG CTA TTC CGT 1372 
Val bys Leu Lys Val Pro Gly Glu Thr Gin Thr Gly Lys Leu Phe Arg 
315 320 325 

ATG CGC GGT AAA GGC GTC AAG TCT GTC CGC GGT GGC GCA CAG GGTJpVT 1420 
Met Arg Gly Lys Gly Val Lys Ser Val Arg Gly Gly Ala Gin Gly Asp 
330 335 340 

TTG CTG TGC CGC GTT GTC GTC GAA ACA CCG GTA GGC CTG AAC GAA AGG 14 68 

Leu Leu Cys Arg Val Val Val Glu Thr Pro Val Gly Leu Asn Glu Arg 
345 350 355 

CAG AAA CAG CTG CTG CAA GAG CTG CAA GAA AGC TTC GGT GGC CCA ACC 1516 
Gin Lys Gin Leu Leu Gin Glu Leu Gin Glu Ser Phe Gly Gly Pro Thr 
360 365 370 375 

GGC GAG CAC AAC AGC CCG CGC TCA AAG AGC TTC TTT GAT GGT GTG AAG 1564 
Gly Glu His Asn Ser Pro Arg Ser Lys Ser Phe Phe Asp Gly Val Lys 
380 385 390 

AAG TTT TTT GAC GAC CTG ACC CGC TAA GGATCCGGCT GAGCAACGAC 1611 
Lys Phe Phe Asp Asp Leu Thr Arg * 
395 400 

GTGAACGCAA TGCGTTCCGA CGTTCAGGCT GCTAAAGATG ACGCAGCTCG TGCTAACCAG 1671 

CG TCTGG ACA ACATGGCTAC TAAATACCGC AAGTAATAGT ACCTGTGAAG TGAAAAATGG 1731 

CGCACATTGT GCGACATTTT TTTTGTCTGC CGTTTACCGC TACTGCGTCA CGCGTAACAT 17 91 

ATTCCCTTGC TCTGGTTCAC CATTCTGCGC TGACTCTACT GAAGGCGCAT TGCTGGCTGC 1851 

GGGAGTTGCT CCACTGCTCA CCGAAACCGG 18B1 



<210> 2 

<211> 400 

<212> PRT 

<213> E. coli 

<4O0> 2 

Met Lys Lys Thr Ala He Ala lie Ala Val Ala Leu Ala Gly Phe Ala 
15 10 15 

Thr Val Ala Gin Ala Gly He Pro Ala Lys Gin Asp Tyr Tyr Glu He 
20 25 30 

Leu Gly Val Ser Lys Thr Ala Glu Glu Arg Glu He Arg Lys Ala Tyr 
35 40 45 
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Lys Arg Leu Ala Met Lys Tyr His Pro Asp Arg Asn Gin Gly Asp Lys 
50 55 60 

Glu Ala Glu Ala Lys Phe Lys Glu lie Lys Glu Ala Tyr Glu Val Leu 
65 70 75 80 

Thr Asp Ser Gin Lys Arg Ala Ala Tyr Asp Gin Tyr Gly His Ala Ala 
85 90 95 - 

Phe Glu Gin Gly Gly Met Gly Gly Gly Gly Phe Gly Gly Gly Ala Asp 
100 105 110 

Phe Ser Asp lie Phe Gly Asp Val Phe Gly Asp lie Phe Gly Gly Gly 
115 120 125 

Arg Gly Arg Gin Arg Ala Ala Arg Gly Ala Asp Leu Arg Tyr Asn Met 
130 135 140 

Glu Leu Thr Leu Glu Glu Ala Val Arg Gly Val Thr Lys Glu lie Arg 
145 150 155 160 

lie Pro Thr Leu Glu Glu Cys Asp Val Cys His Gly Ser Gly Ala Lys 
165 170 175 

Pro Gly Thr Gin Pro Gin Thr Cys Pro Thr Cys His Gly Ser Gly Gin 
180 185 190 

Val Gin Met Arg Gin Gly Phe Phe Ala Val Gin Gin Thr Cys Pro His 
195 200 205 

Cys Gin Gly Arg Gly Thr Leu lie Lys Asp Pro Cys Asn Lys Cys His 
210 215 220 

Gly His Gly Arg Val Glu Arg Ser Lys Thr Leu Ser Val Lys He Pro 
225 230 235 240 

Ala Gly Val Asp Thr Gly Asp Arg He Arg Leu Ala Gly Glu Gly Glu 
245 250 -255 

Ala Gly Glu His Gly Ala Pro Ala Gly Asp Leu Tyr Val Gin Val Gin 
260 265 270 

Val Lys Gin His Pro He Phe Glu Arg Glu Gly Asn Asn Leu Tyr Cys 
275 280 285 

Glu Val Pro He Asn Phe Ala Met Ala Ala Leu Gly Gly Glu lie Glu 
290 295 300 

Val Pro Thr Leu Asp Gly Arg Val Lys Leu Lys Val Pro Gly Glu Thr 
305 310 315 320 

Gin Thr Gly Lys Leu Phe Arg Met Arg Gly Lys Gly Val Lys Ser Val 
325 330 335 

Arg Gly Gly Ala Gin Gly Asp Leu Leu Cys Arg Val Val Val Glu Thr 
340 345 350 
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Pro Val Gly Leu Asn Glu Arg Gin Lys Gin Leu Leu Gin Glu Leu Gin 

355 360 365 

Glu Ser Phe Gly Gly Pro Thr Gly Glu His Asn Ser Pro Arg Ser Lys 

370 375 380 

Ser Phe Phe Asp Gly val Lys Lys Phe Phe Asp Asp Leu Thr Arg * 

385 390 395 - - ^30 



<210> 3 

<211> 1881 

<212> DNA 

<213> E . coli 

<220> 

<221> CDS 

<222> (392) . . . (790) 

<400> 3 

TAGGCGTATC ACGAGGCCCT TTGGATAACC AG AAG CAATA AAAAATCAAA TCGGATTTCA 60 

CTATATAATC TCACTTTATC TAAGATGAAT CCGATGGAAG CATCCTGTTT TCTCTCAATT 120 

TTTTTATCTA AAACCCAGCG TTCGATGCTT CTTTGAGCGA ACGATCAAAA ATAAGTGCCT 180 

TCCCATCAAA AAAATATTCT CAACATAAAA AACTTTGTGT AATACTTGTA ACGCTACATG 24 0 

GAGATTAACT CAATCTAGCT AGAGAGGCTT TACACTTTAT GCTTCCGGCT CGTATAATGT 300 

GTGGAATTGT GAGCGGATAA CAATTTCACA CAGGAAACAG CTATGACCAT GATTACGGAT 3 60 

TCACTGGAAC TCTAGATAAC GAGGGCAAAA A ATG AAA AAG ACA GCT ATC GCG 412 

Met Lys Lys Thr Ala lie Ala 
1 5 

ATT GCA GTG GCA CTG GCT GGT TTC GCT ACC GTA GCG CAG GCC GGA ATT 460 
He Ala Val Ala Leu Ala Gly Phe Ala Thr Val Ala Gin Ala Gly He 
10 15 20 

CCA GCT AAG CAA GAT TAT TAC GAG ATT TTA GGC GTT TCC AAA ACA GCG 508 
Pro Ala Lys Gin Asp Tyr Tyr Glu lie Leu Gly Val Ser Lys Thr Ala 
25 30 35 

GAA GAG CGT GAA ATC AGA AAG GCC TAC AAA CGC CTG GCC ATG AAA TAC 556 
Glu Glu Arg Glu He Arg Lys Ala Tyr Lys Arg Leu Ala Met Lys Tyr 
40 45 50 55 

CAC CCG GAC CGT AAC CAG GGT GAC AAA GAG GCC GAG GCG AAA TTT AAA 604 
His Pro Asp Arg Asn Gin Gly Asp Lys Glu Ala Glu Ala Lys Phe Lys 
60 65 70 
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15 
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25 



30 



35 



40 



45 



SO 



SS 



GAG ATC AAG GAA GCT TAT GAA GTT CTG ACC GAC TCG CAA AAA CGT GCG 652 
Glu lie Lys Glu Ala Tyr Glu Val Leu Thr Asp Ser Gin Lys Arg Ala 
75 80 85 

GCA TAC GAT CAG TAT GGT CAT GCT GCG TTT GAG CAA GGT GGC ATG GGC 700 
Ala Tyr Asp Gin Tyr Gly His Ala Ala Phe Glu Gin Gly Gly Met Gly 
90 95 100 

GGC GGC GGT TTT GGC GGC GGC GCA GAC TTC AGC GAT ATT TTT CGT^AC 74 8 
Gly Gly Gly Phe Gly Gly Gly Ala Asp Phe Ser Asp lie Phe Gly Asp 
105 110 115 

GTT TTC GGC GAT ATT TTT GGC GGC GGA CGT GGT CGT TAA TAG 790 
Val Phe Gly Asp lie Phe Gly Gly Gly Arg Gly Arg * * 
120 125 130 

GCGGCGCGCG GTGCTGATTT ACGCTATAAC ATGGAGCTCA CCCTCGAAGA AGCTGTACGT 850 

GGCGTGACCA AAGAGATCCG CATTCCGACT CTGGAAGAGT GTGACGTTTG CCACGGTAGC 910 

GGTGCAAAAC CAGGTACACA GCCGCAGACT TGTCCGACCT GTCATGGTTC TGGTCAGGTG 970 

CAGATGCGCC AGGGATTCTT CGCTGTACAG CAGACCTGTC CACACTGTCA GGGCCGCGGT 1030 

ACGCTGATCA AAGATCCGTG CAACAAATGT CATGGTCATG GTCGTGTTGA GCGCAGCAAA 1090 

ACGCTGTCCG TTAAAATCCC GGCAGGGGTG GACACTGGAG ACCGCATCCG TCTTGCGGGC 1150 

GAAGGTGAAG CGGGCGAGCA TGGCGCACCG GCAGGCGATC TGTACGTTCA GGTTCAGGTT 1210 

AAACAGCACC CGATTTTCGA GCGTGAAGGC AACAACCTGT ATTGCGAAGT CCCGATCAAC 1270 

TTCGCTATGG CGGCG CTGGG TGGCGAAATC GAAGTAC CGA CCCTTGATGG TCGCGTCAAA 133 0 

CTGAAAGTGC CTGGCGAAAC CCAGACCGGT AAGCTATTCC GTATGCGCGG TAAAGGCGTC 13 90 

AAGTCTGTCC GCGGTGGCGC ACAGGGTGAT TTGCTGTGCC GCGTTGTCGT CGAAACACCG 14 50 

GTAGGCCTGA ACGAAAGGCA GAAACAGCTG CTGCAAGAGC TGCAAGAAAG CTTCGGTGGC 1510 

CCAACCGGCG AGCACAACAG CCCGCGCTCA AAGAGCTTCT TTGATGGTGT GAAGAAGTTT 1570 

TTTGACGACC TGACCCGCTA AGGATCCGGC TGAGCAACGA CGTGAACGCA ATGCGTTCCG 1630 

ACGTTCAGGC TGCTAAAGAT GACGCAGCTC GTGCTAACCA GCGTCTGGAC AACATGGCTA 1690 

CTAAATACCG CAAGTAATAG TACCTGTGAA GTGAAAAATG GCGCACATTG TGCGACATTT 17 50 

TTTTTGTCTG CCGTTTACCG CTACTGCGTC ACGCGTAACA TATTCCCTTG CTCTGGTTCA 1810 

CCATTCTGCG CTGACTCTAC TGAAGGCGCA TTGCTGGCTG CGGGAGTTGC TCCACTGCTC 18 70 

ACCGAAACCG G 1881 
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<210> 4 

<211> 133 

<212> PRT 

<213> E . COli 

<400> 4 

Met Lys Lys Thr Ala lie Ala lie Ala val Ala Leu Ala Gly Phe Ala 
1 5 10 - 

Thr Val Ala Gin Ala Gly lie Pro Ala Lys Gin Asp Tyr Tyr Glu He 
20 25 30 

Leu Gly Val Ser Lys Thr Ala Glu Glu Arg Glu He Axg Lys Ala Tyr 
35 40 45 

Lys Arg Leu Ala Met Lys Tyr His Pro Asp Arg Asn Gin Gly Asp Lys 
50 55 60 

Glu Ala Glu Ala Lys Phe Lys Glu He Lys Glu Ala Tyr Glu Val Leu 
65 70 75 80 

Thr Asp Ser Gin Lys Arg Ala Ala Tyr Asp Gin Tyr Gly His Ala Ala 
.85 90 95 

Phe Glu Gin Gly Gly Met Gly Gly Gly Gly Phe Gly Gly Gly Ala Asp 
100 105 110 

Phe Ser Asp lie Phe Gly Asp Val Phe Gly Asp He Phe Gly Gly Gly 
115 120 125 

Arg Gly Arg * * 
130 

35 

<210> 5 
<211> 1379 
<212> DNA 
40 <213> E. COli 

<220> 

<221> CDS 

<222> (392) . . . (1090) 

45 

<400> 5 

TAGGCGTATC ACGAGGCCCT TTGGATAACC AGAAGCAATA AAAAATCAAA TCGGATTTCA 60 
SO CTATATAATC TCACTTTATC TAAGATGAAT CCGATGGAAG CATCCTGTTT TCTCTCAATT 120 

TTTTTATCTA AAACCCAGCG TTCGATGCTT CTTTGAGCGA ACGATCAAAA ATAAGTGCCT 180 
TCCCATCAAA AAAATATTCT CAACATAAAA AACTTTGTGT AATACTTGTA ACGCTACATG 240 
GAGATTAACT CAATCTAGCT AGAGAGGCTT TACACTTTAT GCTTCCGGCT CGTATAATGT 300 



10 



75 



20 



25 



30 



55 
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GTGGAATTGT GAGCGGATAA CAATTTCACA CAGGAAACAG CTATGACCAT GATTACGGAT 360 

5 TCACTGGAAC TCTAGATAAC GAGGGCAAAA A ATG AAA AAG ACA GCT ATC GCG 412 

Met Lys Lys Thr Ala lie Ala 
1 5 

ATT GCA GTG GCA CTG GCT GGT TTC GCT ACC GTA GCG CAG GCC GGA MT 460 
10 lie Ala Val Ala Leu Ala Gly Phe Ala Thr Val Ala Gin Ala Gly^Tle 

10 15 20 

CTC ACC GAG CGC CGC GTG CCC TTC TCG CTG CTG CGG AGC CCG AGC TGG 508 
Leu Thr Glu Arg Arg Val Pro Phe Ser Leu Leu Arg Ser Pro Ser Trp 
1S 25 30 35 

GAA CCA TTC CGG GAC TGG TAC CCT GCA CAC AGC CGC CTC TTC GAT CAA 556 
Glu Pro Phe Arg Asp Trp Tyr Pro Ala His Ser Arg Leu Phe Asp Gin 
40 45 50 55 



20 



25 



30 



35 



40 



45 



50 



55 



GCT TTC CGG GTG CCC CGG TTG CCC GAT GAG TGG TCG CAG TGG TTC AGC 604 
Ala Phe Gly Val Pro Arg Leu Pro Asp Glu Trp Ser Gin Trp Phe Ser 
60 65 70 

GCC GCT GGG TGG CCC GGA TAC GTG CGC CCG CTG CCC GCC GCG ACC GCC 652 
Ala Ala Gly Trp Pro Gly Tyr Val Arg Pro Leu Pro Ala Ala Thr Ala 

75 80 85 

GAG GGC CCC GCG GCG GTG ACC CTG GCC GCA CCA GCC TTC AGC CGA GCG 7 00 

Glu Gly Pro Ala Ala Val Thr Leu Ala Ala Pro Ala Phe Ser Arg Ala 
90 95 100 

CTC AAC CGA CAG CTC AGC AGC GGG GTC TCG GAG ATC CGA CAG ACG GCT 74 8 

Leu Asn Arg Gin Leu Ser Ser Gly Val Ser Glu lie Arg Gin Thr Ala 
105 110 115 

GAT CGC TGG CGC GTG TCC CTG GAC GTC AAC CAC TTC GCT CCG GAG GAG 796 
Asp Arg Trp Arg Val Ser Leu Asp Val Asn His Phe Ala Pro Glu Glu 
120 125 130 ^ 135 

CTC ACA GTG AAG ACC AAG GAA GGC GTG GTG GAG ATC ACT GGC AAG CAC 844 
Leu Thr Val Lys Thr Lys Glu Gly Val Val Glu lie Thr Gly Lys His 
140 145 150 

GAA GAA AGG CAG GAC GAA CAT GGC TAC ATC TCT CGG TGC TTC ACC CGG 892 
Glu Glu Arg Gin Asp Glu His Gly Tyr lie Ser Arg Cys Phe Thr Arg 
155 160 165 

AAA TAC ACG CTC CCT CCA GGT GTG GAC CCC ACC CTA GTG TCC TCT TCC 94 0 

Lys Tyr Thr Leu Pro Pro Gly Val Asp Pro Thr Leu Val Ser Ser Ser 
170 175 180 

CTA TCC CCT GAG GGC ACA CTT ACC GTG GAG GCT CCG TTG CCC AAA GCA 988 

Leu Ser Pro Glu Gly Thr Leu Thr val Glu Ala Pro Leu Pro Lys Ala 

185 190 195 
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15 
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30 



35 



40 



45 



SO 



55 



GTC ACG GAG TCA GCG GAG ATC ACC ATT CCG GTT ACT TTC GAG GCC CGC 103 6 

val Thr Gin Ser Ala Glu He Thr He Pro Val Thr Phe Glu Ala Arg 
200 205 210 215 

GCC CAA ATT GGG GGC CCA GAA GCT GGG AAG TCT GAA CAG TCT GGA GCC 10 84 

Ala Gin He Gly Gly Pro Glu Ala Gly Lys Ser Glu Gin Ser Gly Ala 
220 225 230 

AAG TAG GATCCGGCTG AGCAACGACG TGAACGCAAT GCGTTCCGAC GTTCAGGCMG 114 0 

Lys * 



CTAAAGATGA CGCAGCTCGT GCTAACCAGC GTCTGGACAA CATGGCTACT AAATACCGCA 12 00 

AGTAATAGTA CCTGTGAAGT GAAAAATGGC GCACATTGTG CGACATTTTT TTTGTCTGCC 12 60 

. GTTTACCGCT ACTGCGTCAC GCGTAACATA TTCCCTTGCT CTGGTTCACC ATTCTGCGCT 132 0 

GACTCTACTG AAGGCGCATT GCTGGCTGCG GGAGTTGCTC CACTGCTCAC CGAAACCGG 13 79 



<210> 6 

<211> 233 

<212> PRT 

<213> E. coli 

<400> 6 

Met Lys Lys Thr Ala He Ala lie Ala Val Ala Leu Ala Gly Phe Ala 
15 10 15 

Thr Val Ala Gin Ala Gly He Leu Thr Glu Arg Arg Val Pro Phe Ser 
20 25 30 

Leu Leu Arg Ser Pro Ser Trp Glu Pro Phe Arg Asp Trp Tyr Pro Ala 
35 40 45 

His Ser Arg Leu Phe Asp Gin Ala Phe Gly Val Pro Arg Leu** Pro Asp 
50 55 60 

Glu Trp Ser Gin Trp Phe Ser Ala Ala Gly Trp Pro Gly Tyr Val Arg 
65 70 75 80 

Pro Leu Pro Ala Ala Thr Ala Glu Gly Pro Ala Ala Val Thr Leu Ala 
85 90 95 

Ala Pro Ala Phe Ser Arg Ala Leu Asn Arg Gin Leu Ser Ser Gly Val 
100 105 110 

Ser Glu He Arg Gin Thr Ala Asp Arg Trp Arg Val Ser Leu Asp Val 
115 120 125 

Asn His Phe Ala Pro Glu Glu Leu Thr Val Lys Thr Lys Glu Gly Val 
130 135 140 
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10 



15 



Val Glu He Thr Gly Lys His Glu Glu Arg Gin Asp Glu His Gly Tyr 
145 150 155 160 

He Ser Arg Cys Phe Thr Arg Lys Tyr Thr Leu Pro Pro Gly Val Asp 
165 170 175 

Pro Thr Leu Val Ser Ser Ser Leu Ser Pro Glu Gly Thr Leu Thr Val 
180 185 190 ^ 

Glu Ala Pro Leu Pro Lys Ala Val Thr Gin Ser Ala Glu He Thr He 
195 200 205 

Pro Val Thr Phe Glu Ala Arg Ala Gin He Gly Gly Pro Glu Ala Gly 
210 215 220 

Lys Ser Glu Gin Ser Gly Ala Lys * 
225 230 



<210> 7 

<211> 1256 

<212> DNA 

<213> £ . COli 

<220> 

<221> CDS 
<222> (199) . . . (969) 

<400> 7 

GATCTGGCTT TACACTTTAT GCTTCCGGCT CGTATGTTGT GTGGAATTGT GAGCGGATAA 60 

CAATTTCACA CAGGAAACAG CTATGACCAT GATTACGCCA AGCTTGCATG CAAATTCTAT 120 

TTCAAGGAGA CAGTCATAAT GAAATACCTA TTGCCTACGG CAGCCGCTGG ATTGTTATTA 180 

CTTCGCGGCCC AGCCGGCC ATG GCC GAG GTC AAG CTG CAG GAG TCT GGG CGA 231 

Met Ala Glu Val Lys Leu Gin Glu Ser^Gly Gly 
15 10 

GGC TTA GTG CAG CCT GGA GGG TCC CGG AAA CTC TCC TGT GCA GCC TCT 279 
Gly Leu Val Gin Pro Gly Gly Ser Arg Lys Leu Ser Cys Ala Ala Ser 
15 20 25 

GGA TTC ACT TTC AGT AGC TTT GGA ATG CAC TGG GTT CGT CAG GCT CCA 327 
Gly Phe Thr Phe Ser Ser Phe Gly Met His Trp Val Arg Gin Ala Pro 
30 35 40 

GAG AAG GGG CTG GAG TGG GTC GCA TAT ATT AGT AGT GGC AGT AGT ACC 375 
50 Glu Lys Gly Leu Glu Trp Val Ala Tyr He Ser Ser Gly Ser Ser Thr 

45 50 55 

ATC TAC TAT GCA GAC ACA GTG AAG GGC CGA TTC ACC ATC TCC AGA GAC 4 23 

He Tyr Tyr Ala Asp Thr Val Lys Gly Arg Phe Thr He Ser Arg Asp 
55 60 65 70 75 



25 



30 



35 



40 



45 
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AAT CCC AAC AAC ACC CTG TTC CTG CAA ATG ACC AGT CTA AGG TCT GAG 4 71 

Asn Pro Lys Asn Thr Leu Phe Leu Gin Met Thr Ser Leu Arg Ser Glu 
80 85 90 

5 

GAC ACG GCC ATG TAT TAC TGC GCA AGA GAT TAC GGG GCT TAT TGG GGC 519 

Asp Thr Ala Met Tyx Tyr Cys Ala Arg Asp Tyr Gly Ala Tyr Trp Gly 

95 100 105 

-10 CAA GGG ACC ACG GTC ACC GTC TCC TCA GGT GGA GGC GGT TCA GGC jlSA 567 

Gin Gly Thr Thr val Thr Val Ser ser Gly Gly Gly Gly Ser Gly Gly 
110 115 120 

GGT GGC TCT GGC GGT GGC GGA TCG GAC ATT GAG CTC ACC CAG TCT CCA 615 
15 Gly Gly Ser Gly Gly Gly Gly Ser Asp lie Glu Leu Thr Gin Ser Pro 

125 130 135 

GCA ATC ATG TCT GCA TCT CCA GGG GAG AAG GTC ACC ATG ACC TGC AGT 663 
Ala lie Met Ser Ala Ser Pro Gly Glu Lys Val Thr Met Thr Cys Ser 
140 145 150 155 



20 



25 



30 



35 



40 



45 



50 



55 



GCC AGT TCA AGT GTA AGG TAC ATG AAC TGG TTC CAA CAG AAG TCA GGC 711 
Ala Ser Ser Ser Val Arg Tyr Met Asn Trp Phe Gin Gin Lys Ser Gly 
160 165 170 

ACC TCC CCC AAA AGA TGG ATT TAT GAC ACA TCC AAA CTG TCT TCT GGA 759 
Thr Ser Pro Lys Arg Trp He Tyr Asp Thr Ser Lys Leu Ser Ser Gly 
175 180 185 

GTC CCT GCT CGC TTC AGT GGC AGT GGG TCT GGG ACC TCT TAC TCT CTC 807 
Val Pro Ala Arg Phe Ser Gly Ser Gly Ser Gly Thr Ser Tyr Ser Leu 
190 195 200 

ACA ATC AGC AGC ATG GAG GCT GAA GAT GCT GCC ACT TAT TAC TGC CAG 855 
Thr He Ser Ser Met Glu Ala Glu Asp Ala Ala Thr Tyr Tyr Cys Gin 
205 210 215 

CAG TGG AGT AGT AAT CCA CTC ACT TTC GGT GCT GGG ACC AAG CTG GAG 903 
Gin Trp Ser Ser Asn Pro Leu Thr Phe Gly Ala Gly Thr Lys Leu Glu 
220 225 230 * 235 

CTG AAA CGG GCG GCC GCA GAA CAA AAA CTC ATC TCA GAA GAG GAT CTG 951. 
Leu Lys Arg Ala Ala Ala Glu Gin Lys Leu He Ser Glu Glu Asp Leu 
240 245 250 

AAT GGG GCC GCA TAG TAA CTGAGCAACG ACGTGAACGC AATGCGTTCC 999 
Asn Gly Ala Ala * * 
255 

GACGTTCAGG CTGCTAAAGA TGACGCAGCT CGTGCTAACC AGCGTCTGGA CAACATGGCT 1059 

ACTAAATACC GCAAGTAATA GTACCTGTGA AGTGAAAAAT GGCGCACATT GTGCGACATT 1119 

TTTTTTGTCT GCCGTTTACC GCTACTGCGT CACGCGTAAC ATATTCCCTT GCTCTGGTTC 1179 

ACCATTCTGC GCTGACTCTA CTGAAGGCGC ATTGCTGGCT GCGGGAGTTG CTCCACTGCT 123 9 
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CACCGAAACC GGAGATC 1256 



<210> 8 

<211> 257 

<212> PRT 

<213> E. coli _ 

<400> 8 

Met Ala Glu Val Lys Leu Gin Glu Ser Gly Gly Gly Leu Val Gin Pro 

15 10 15 

Gly Gly Ser Arg Lys Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser 
20 25 30 

Ser Phe Gly Met His Trp Val Arg Gin Ala Pro Glu Lys Gly Leu Glu 
2Q 35 40 45 

Trp Val Ala Tyr lie Ser Ser Gly Ser Ser Thr lie Tyr Tyr Ala Asp 
50 55 60 

25 Thr Val Lys Gly Arg Phe Thr lie Ser Arg Asp Asn Pro Lys Asn Thr 

65 70 75 80 

Leu Phe Leu Gin Met Thr Ser Leu Arg Ser Glu Asp Thr Ala Met Tyr 
85 90 95 
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40 



45 
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Tyr Cys Ala Azrg Asp Tyr Gly Ala Tyr Trp Gly Gin Gly Thr Thr Val 
100 105 110 

Thr Val Ser Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 
115 120 125 

Gly Gly Ser Asp lie Glu Leu Thr Gin Ser Pro Ala lie Met Ser Ala 
130 135 140 

Ser Pro Gly Glu Lys Val Thr Met Thr Cys Ser Ala Ser Ser Ser Val 
145 150 155 160 

Arg Tyr Met Asn Trp Phe Gin Gin Lys Ser Gly Thr Ser Pro Lys Arg 
165 170 175 

Trp lie Tyr Asp Thr Ser Lys Leu Ser Ser Gly Val Pro Ala Arg Phe 
180 185 190 

Ser Gly Ser Gly Ser Gly Thr Ser Tyr Ser Leu Thr lie Ser Ser Met 
195 200 205 

Glu Ala Glu Asp Ala Ala Thr Tyr Tyr Cys Gin Gin Trp Ser Ser Asn 
210 215 220 

Pro Leu Thr Phe Gly Ala Gly Thr Lys Leu Glu Leu Lys Arg Ala Ala 
225 230 235 240 
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Ala Glu Gin Lys Leu He Ser Glu Glu Asp Leu Asn Gly Ala Ala * 
245 250 255 



<210> 9 

<211> 1137 - - # 

<212> DNA 

<213> E. coli 

<220> 

<221> CDS 
<222> (1) . . . (1137) 

<400> 9 

ATG AAA TAC CTG CTG CCG ACC GCT GCT GCT GGT CTG CTG CTC CTC GCT 4 8 

Met Lys Tyr Leu Leu Pro Thr Ala Ala Ala Gly Leu Leu Leu Leu Ala 
15 10 15 

GCC CAG CCG GCG ATG GCC ATG GCT TAC CAA GGA AAC AGT GAC TGC TAC 96 
25 Ala Gin Pro Ala Met Ala Met Ala Tyr Gin Gly Asn Ser Asp Cys Tyr 

20 25 30 

TTT GGG AAT GGG TCA GCC TAC CGT GGC ACG CAC AGC CTC ACC GAG TCG 144 
Phe Gly Asn Gly Ser Ala Tyr Arg Gly Thr His Ser Leu Thr Glu Ser 
35 40 45 



10 
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20 



30 



35 



40 



45 
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ss 



GGT GCC TCC TGC CTC CCG TGG AAT TCC ATG ATC CTG ATA GGC AAG GTT 192 
Gly Ala Ser Cys Leu Pro Trp Asn Ser Met He Leu He Gly Lys Val 
50 55 60 

TAC ACA GCA CAG AAC CCC AGT GCC CAG GCA CTG GGC CTG GGC AAA CAT 240 
Tyr Thr Ala Gin Asn Pro Ser Ala Gin Ala Leu Gly Leu Gly Lys His 
65 70 75 80 

AAT TAC TGC CGG AAT CCT GAT GGG GAT GCC AAG CCC TGG TGC'CAC GTG 288 
Asn Tyr Cys Arg Asn Pro Asp Gly Asp Ala Lys Pro Trp Cys His Val 
85 90 95 

CTG ACG AAC CGC AGG CTG ACG TGG GAG TAC TGT GAT GTG CCC TCC TGC 33 6 

Leu Thr Asn Arg Arg Leu Thr Trp Glu Tyr Cys Asp Val Pro Ser Cys 
100 105 110 

TCC ACC TGC GGC CTG AGA CAG TAC AGC CAG CCT CAG TTT CGC ATC AAA 384 
Ser Thr Cys Gly Leu Arg Gin Tyr Ser Gin Pro Gin Phe Arg He Lys 
115 120 125 

GGA GGG CTC TTC GCC GAC ATC GCC TCC CAC CCC TGG CAG GCT GCC ATC 432 
Gly Gly Leu Phe Ala Asp lie Ala Ser His Pro Trp Gin Ala Ala He 
130 135 140 
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55 



TTT GCC AAG CAC AGG AGG TCG CCC GGA GAG CGG TTC CTG TGC GGG GGC 480 

Phe Ala Lys His Arg Arg Ser Pro Gly Glu Arg Phe Leu Cys Gly Gly 

145 150 155 160 

ATA CTC ATC AGC TCC TGC TGG ATT CTC TCT GCC GCC CAC TGC TTC CAG 52 8 

lie Leu lie Ser Ser Cys Trp lie Leu Ser Ala Ala His Cys Phe Gin 
165 170 175 

GAG AGG TTT CCG CCC CAC CAC CTG ACG GTG ATC TTG GGC AGA ACA^AC 576 

Glu Arg Phe Pro Pro His His Leu Thr Val lie Leu Gly Arg Thr Tyr 
180 185 190 



CGG GTG GTC CCT GGC GAG GAG GAG CAG AAA TTT GAA GTC GAA AAA TAC 624 

15 Arg Val Val Pro Gly Glu Glu Glu Gin Lys Phe Glu Val Glu Lys Tyr 

195 200 205 

ATT GTC CAT AAG GAA TTC GAT GAT GAC ACT TAC GAC AAT GAC ATT GCG 672 

Tie Val His Lys Glu Phe Asp Asp Asp Thr Tyr Asp Asn Asp He Ala 
210 215 220 



CTG CTG CAG CTG AAA TCG GAT TCG TCC CGC TGT GCC CAG GAG AGC AGC 720 
Leu Leu Gin Leu Lys Ser Asp Ser Ser Arg Cys Ala Gin Glu Ser Ser 
225 230 235 240 

GTG GTC CGC ACT GTG TGC CTT CCC CCG GCG GAC CTG CAG CTG CCG GAC 768 
Val Val Arg Thr Val Cys Leu Pro Pro Ala Asp Leu Gin Leu Pro Asp 
245 250 255 

TGG ACG GAG TGT GAG CTC TCC GGC TAC GGC AAG CAT GAG GCC TTG TCT 816 
Trp Thr Glu Cys Glu Leu Ser Gly Tyr Gly Lys His Glu Ala Leu Ser 
260 265 270 

CCT TTC TAT TCG GAG CGG CTG AAG GAG GCT CAT GTC AGA CTG TAC CCA 8 64 

Pro Phe Tyr Ser Glu Arg Leu Lys Glu Ala His Val Arg Leu Tyr Pro 
275 280 285 

TCC AGC CGC TGC ACA TCA CAA CAT TTA CTT AAC AGA ACA GTC ACC GAC 912 
Ser Ser Arg Cys Thr Ser Gin His Leu Leu Asn Arg Thr Val^Thr Asp 
290 295 300 

AAC ATG CTG TGT GCT GGA GAC ACT CGG AGC GGC GGG CCC CAG GCA AAC 960 
Asn Met Leu Cys Ala Gly Asp Thr Arg Ser Gly Gly Pro Gin Ala Asn 
305 310 315 320 

TTG CAC GAC GCC TGC CAG GGC GAT TCG GGA GGC CCC CTG GTG TGT CTG 1008 
Leu His Asp Ala Cys Gin Gly Asp Ser Gly Gly Pro Leu Val Cys Leu 
325 330 335 

AAC GAT GGC CGC ATG ACT TTG GTG GGC ATC ATC AGC TGG GGC CTG GGC 1056 
Asn Asp Gly Arg Met Thr Leu Val Gly lie He Ser Trp Gly Leu Gly 
340 345 350 

TGT GGA CAG AAG GAT GTC CCG GGT GTG TAC ACC AAG GTT ACC AAC TAC 1104 
Cys Gly Gin Lys Asp Val Pro Gly Val Tyr Thr Lys Val Thr Asn Tyr 
355 360 365 
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CTA GAC TGG ATT CGT GAC AAC ATG CGA CCG TGA 1137 
Leu Asp Trp lie Arg Asp Asn. Met Arg Pro * 
370 375 



<210> 10 

<211> 379 

10 <212> PRT - - 

<213> E. coli ^* 

<400> 10 

1S Met Lys Tyr Leu Leu Pro Thr Ala Ala Ala Gly Leu Leu Leu Leu Ala 

15 10 15 

Ala Gin Pro Ala Met Ala Met Ala Tyr Gin Gly Asn Ser Asp Cys Tyr 
20 25 30 

20 

Phe Gly Asn Gly Ser Ala Tyr Arg Gly Thr His Ser Leu Thr Glu Ser 
35 40 45 



25 



30 



35 



40 



45 



SO 



55 



Gly Ala Ser Cys Leu Pro Trp Asn Ser Met lie Leu lie Gly Lys Val 
50 55 60 

Tyr Thr Ala Gin Asn Pro Ser Ala Gin Ala Leu Gly Leu Gly Lys His 
65 70 75 80 

Asn Tyr Cys Arg Asn Pro Asp Gly Asp Ala Lys Pro Trp Cys His Val 
85 90 95 

Leu Thr Asn Arg Arg Leu Thr Trp Glu Tyr Cys Asp Val Pro Ser Cys 
100 105 110 

Ser Thr Cys Gly Leu Arg Gin Tyr Ser Gin Pro Gin Phe Arg He Lys 
115 120 125 

Gly Gly Leu Phe Ala Asp He Ala Ser His Pro Trp Gin Ala Ala He 
130 135 140 

Phe Ala Lys His Arg Arg Ser Pro Gly Glu Arg Phe Leu Cys Gly Gly 
145 150 155 160 

He Leu lie Ser Ser Cys Trp He Leu Ser Ala Ala His Cys Phe Gin 
165 170 175 

Glu Arg Phe Pro Pro His His Leu Thr Val He Leu Gly Arg Thr Tyr 
180 185 190 

Arg Val Val Pro Gly Glu Glu Glu Gin Lys Phe Glu Val Glu Lys Tyr 
195 200 205 

He Val His Lys Glu Phe Asp Asp Asp Thr Tyr Asp Asn Asp He Ala 
210 215 220 
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20 



25 



30 



Leu Leu Gin Leu Lys Ser Asp Ser Ser Axg Cys Ala Gin Glu Ser Ser 
225 230 235 240 

Val Val Arg Thr Val cys Leu Pro Pro Ala Asp Leu Gin Leu Pro Asp 
245 250 255 

Trp Thr Glu Cys Glu Leu Ser Gly Tyr Gly Lys His Glu Ala Leu Ser 
260 265 - 27^ 

Pro Phe Tyr Ser Glu Arg Leu Lys Glu Ala His Val Arg Leu Tyr Pro 
275 280 285 

Ser Ser Arg Cys Thr Ser Gin His Leu Leu Asn Arg Thr Val Thr Asp 
290 295 300 

Asn Met Leu Cys Ala Gly Asp Thr Arg Ser Gly Gly Pro Gin Ala Asn 
305 310 315 320 

Leu His Asp Ala Cys Gin Gly Asp Ser Gly Gly Pro Leu Val Cys Leu 
325 330 335 

Asn Asp Gly Arg Met Thr Leu Val Gly lie lie Ser Trp Gly Leu Gly 
340 345 350 

Cys Gly Gin Lys Asp Val Pro Gly Val Tyr Thr Lys Val Thr Asn Tyr 
355 360 365 

Leu Asp Trp lie Arg Asp Asn Met Arg Pro * 
370 375 
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PatentansprOche 

40 1. Verfahren zur Herstellung eines naturlich gefalteten eukaryontischen Polypeptids, enthaltend zwei Oder mehrere 
uber Disulfidbrucken verknupfte Cysteine, durch 

a) Kultivierung prokaryontischer Zellen, wobei die genannten prokaryontischen Zellen einen Expressionsvek- 
tor enthalten, der fur das genannte Polypeptid, das am N-Terminus eine prokaryontische Signalsequenz ent- 

45 halt, codiert, 

b) Sekretion des Polypeptids in das Periplasma Oder das Medium, 

c) Abspaitung der Signalsequenz und Isolierung des Polypeptids aus dem Periplasma Oder dem Medium, 



so 



55 



dadurch gekennzeichnet, daG in der genannten prokaryontischen Zelle zusatzlich eine fur ein molekulares Cha- 
peron codierende Nukleinsaure exprimiert und das Chaperon ins Periplasma sekretiert wird. 

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daft als Chaperon DNAJ oder HSP25 verwendet wird. 

3. Verfahren nach den Anspruchen 1 bis 2, dadurch gekennzeichnet, da3 dem Nahrmedium ein reduzierendes Thiol- 
reagenz zugesetzt wird. 
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4. Veriahren nach Anspruch 3, dadurch gekennzeichnet, daG als reduzierendes Thiolreagenz Glutathion (GSH) ver- 
wendel wird. 

5. Verfahren nach den Anspruchen 1 bis 4, dadurch gekennzeichnet, daG die Signalsequenz aus gramnegativen 
5 Bakterien stammt. 

6. Verfahren nach einem der Anspruche 1 bis 5, dadurch gekennzeichnet, daG die fur das molekulare Chaperon 
codierende Nukleinsaure und die fur das Polypeptid codierende Nukleinsaure auf zwei getrennten Vektoren loka- 
lisiert sind. 

7. Verfahren nach einem der Anspruche 1 bis 5, dadurch gekennzeichnet, daG die fur das molekulare Chaperon 
codierende Nukleinsaure auf dem Expressionsvektor, welcher auch die fur das Polypeptide codierende Nuklein- 
saure enthalt, lokalisiert ist. 

is 8. Verfahren nach einem der Anspruche 6 oder 7, dadurch gekennzeichnet, daB die fur das molekulare Chaperon 
codierende rekombinante DNA in operativer Verknupfung mit einem DNA-Fragment steht, das ein Signalpeptid 
zum Durchdringen der inneren bakterieilen Membran codiert. 

9. Verfahren nach einem der Anspruche 6 bis 8, dadurch gekennzeichnet, daG sich die fur das sekretierte molekulare 
20 Chaperon und/oder fur das sekretierte Protein codierende DNA unter Kontrolle eines induzierbaren Expressions- 
signals behndet 

10. Verfahren nach einem der Anspruche 1 bis 9, dadurch gekennzeichnet, daG das Polypeptid ein Antikorper, Anti- 
korperfragment, Interferon, Proteinhormon oder eine Protease ist. 

25 
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Fig.3 

pACYC177 




(BamHI) 
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Fig. 4 
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Fig. 7 
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